Trabajo Final del Curso Manejo y Visualización de Datos: 30 años de descubrimientos de planetas más allá del sistema solar
Autor: Lic. Joaquín Ferreyra
Autor: Lic. Joaquín Ferreyra
1 Introducción
Los exoplanetas o planetas extrasolares son planetas que orbitan alrededor de otras estrellas que se encuentran más allá de nuestro sistema solar. En los últimos 20 años se han encontrado más de 5000 planetas extrasolares, los cuales incluyen mundos pequeños y rocosos como la Tierra, gigantes gaseosos muchas veces más grandes que Júpiter, planetas “superterrestres”, que son mundos rocosos más grandes que el nuestro, y planetas “subneptunianos”, que son versiones más pequeñas del planeta Neptuno de nuestro sistema solar. También se han encontrado planetas que orbitan alrededor de dos estrellas al mismo tiempo y planetas que describen sus órbitas alrededor de los restos colapsados de estrellas muertas.
Partiendo del enorme interés y curiosidad personal en el tema como motivaciones principales, para la elaboración de este Trabajo Final se optó por la elaboración del presente documento producido en RMarkdown en el que se presenta un resumen descriptivo de las características más sobresalientes de los exoplanetas encontrados desde la década de los ’90 a la actualidad, de los sistemas planetarios de los que forman parte, sitios de descubrimiento y métodos a través de los cuales fueron hallados.
2 Materiales y métodos
2.1 Bases de datos
La base de datos principal se descargó directamente en formato .csv de la web del Archivo de Exoplanetas de la NASA. Este archivo registra los descubrimientos de exoplanetas que han sido reportados en publicaciones científicas revisadas por pares y confirmados utilizando varios métodos de detección y/o técnicas analíticas.
Para cada uno de los exoplanetas de existencia confirmada el Archivo de la NASA cuenta con información sobre el sistema planetario completo (el planeta en sí, su/s luna/s -si existen- y la estrella central del sistema). Estos datos incluyen parámetros estelares (como posiciones, magnitudes y temperaturas), información sobre los exoplanetas descubiertos (como masas y parámetros orbitales) y datos de descubrimiento/caracterización (como las instalaciones e instrumental utilizados, métodos de descubrimiento, curvas de velocidad radial publicadas, curvas de luz fotométrica, imágenes y espectros).
Por una cuestión de simplicidad en el análisis, se hizo uso de las herramientas dinámicas en la web citada para seleccionar únicamente algunas variables de interés, fundamentalmente aquellas que permiten caracterizar desde el punto de vista astronómico las características orbitales de los exoplanetas descubiertos y las relacionadas con los descubrimientos en sí (instalaciones y sitios desde los que se hicieron los hallazgos, años de descubrimiento, etc.).
A continuación se presentan las variables seleccionadas que componen la base de datos dataNASA.csv:
| Variable | Tipo de registro [unidades] | Descripción |
|---|---|---|
| pl_name | Caracter | Nombre del planeta más comúnmente usado en la literatura. |
| host_name | Caracter | Nombre de la estrella del sistema planetario más comúnmente usado en la literatura. |
| sy_snum | Numérico | Número de estrellas en el sistema planetario. |
| sy_pnum | Numérico | Número de planetas en el sistema planetario. |
| sy_mnum | Numérico | Número de lunas en el sistema planetario. |
| discoverymethod | Caracter | Método a través del cual el planeta fue identificado por primera vez (Radial Velocity/Transits/Microlensing/Imaging/Timing Variations/Orbital Brightness/Modulation/Astrometry/Disk Kinematics). |
| disc_year | Numérico | Año de descubrimiento del planeta. |
| disc_locale | Caracter | Ubicación del sitio de observación responsable del descubrimiento (Ground/Space/Multiple Locales). |
| disc_facility | Caracter | Nombre de la instalación responsable del descubrimiento. |
| disc_telescope | Caracter | Nombre del telescopio utilizado para hacer las observaciones. |
| disc_instrument | Caracter | Nombre del instrumento utilizado para las observaciones. |
| pl_orbper | Numérico [días] | Periodo orbital del planeta: tiempo que le toma al planeta realizar una órbita completa alrededor de la estrella del sistema. |
| pl_orbsmax | Numérico [unidades astronómicas] | Semi-eje mayor de la órbita: radio más largo de una órbita elíptica o, para los exoplanetas detectados mediante microlente gravitacional o imágenes directas, la separación proyectada en el plano del cielo. |
| pl_rade | Numérico | Radio del planeta medido en unidades del radio de la Tierra. |
| pl_radj | Numérico | Radio del planeta medido en unidades del radio de Júpiter. |
| pl_masse | Numérico | Masa del planeta medida en unidades de masa de la Tierra. |
| sy_dist | Numérico [parsecs] | Distancia desde la Tierra al sistema planetario en el que se encuentra el exoplaneta. |
Por otra parte, se cuenta con la base datos_geo.xlsx, la cual contiene información adicional sobre la ubicación geográfica de los sitios terrestres desde los cuales se descubrieron los exoplanetas, reunida a partir de una búsqueda en la web:
| Variable | Tipo de registro [unidades] | Descripción |
|---|---|---|
| disc_facility | Caracter | Nombre de la instalación responsable del descubrimiento. |
| facility_location | Caracter | Lugar geográfico en el que se encuentra la instalación responsable del descubrimiento. |
| facility_latitude | Coordenada geográfica | Latitud en la que se encuentra la instalación responsable del descubrimiento. |
| facility_longitude | Coordenada geográfica | Longitud en la que se encuentra la instalación responsable del descubrimiento. |
2.2 Limpieza y ordenado de los datos
En relación a la base dataNASA.csv, para poder llevar
adelante el análisis de los datos se procedió a traducir los nombres de
las categorías de ciertas variables con terminología específica al
idioma español (por ejemplo, la variable discoverymethod),
categorizar algunas variables cuantitativas (por ejemplo, las variables
disc_year y pl_rade) y unificar los registros
Multiple locale y Multiple locales de la variable
disc_location, en tanto ambos hacen referencia a que el
descubrimiento se llevó adelante con instrumentos provenientes de
múltiples sitios (este detalle fue advertido durante el análisis
exploratorio preliminar de la variable empleando la función
table()). Todas las acciones descriptas se llevaron
adelante utilizando funciones del paquete dplyr.
En relación a la base datos_geo.xlsx, como se utilizó esta
información para la construcción de mapas, fue necesario expresar la
información sobre latitud y longitud (que se encuentra separada en dos
columnas y en el formato “grados-punto cardinal”) en un formato que
pueda ser utilizado como imput por la función st_as_sf()
para obtener una única columna de clase sfc_MULTIPOLYGON que posibilite
la representación gráfica de las distintas ubicaciones en un mapa
mediante la función geom_sf(). Además, los nombres de los
países en los que se encuentran los distintos observatorios terrestres
fueron traducidos al español para la presentación de la información en
un mapa dinámico. Todas estas acciones fueron llevadas a cabo utilizando
funciones de los paquetes dplyry tidyr.
3 Resultados
3.1 A través del tiempo…
Hasta la fecha, el número de planetas extrasolares cuya existencia ha sido confirmada asciende a 5250. En la Figura 1 se representa gráficamente el número de exoplanetas confirmados por año de descubrimiento, desde 1992, año de confirmación del primer hallazgo, a la actualidad. En general, se observa un incremento en el mismo con el correr de los años, destacándose particularmente los años 2016 y 2014 como los años en los que más exoplanetas fueron encontrados (ver más adelante). En conjunto, en estos años se encontraron 2392 planetas, lo que representa un 45.6% del total de planetas extrasolares confirmados a la fecha. Cabe destacar que, en lo que va del año en curso, se confirmó la existencia de 9 exoplanetas. Entre ellos, se encuentra el cuerpo bautizado como TOI-700e, un exoplaneta de tipo terrestre ubicado a unos 102 años luz de la Tierra.
Si se considera la distribución del número de planetas extrasolares en función del método de descubrimiento a través del cual fueron inicialmente detectados (Tabla 1) se observa que la gran mayoría de ellos fue encontrada por el método de tránsito (75.1%), seguido por el de velocidad radial (19.6%). Le siguen, en mucha menor medida, microlentes (2.9%), detección directa por imágenes (1.2%), variaciones temporales por tránsito y eclipses (0.8%) y modulación orbital de brillo, timing de púlsar, astrometría, variaciones temporales de pulso y cinemática de disco (en conjunto, 0.4%).
| Método de descubrimiento | Número de exoplanetas | Porcentaje (%) |
|---|---|---|
| Tránsito | 3945 | 75.1 |
| Velocidad radial | 1027 | 19.6 |
| Microlentes | 154 | 2.9 |
| Detección directa | 62 | 1.2 |
| Variaciones en el tiempo de tránsito | 24 | 0.5 |
| Variaciones en el tiempo de eclipse | 17 | 0.3 |
| Modulación orbital del brillo | 9 | 0.2 |
| Tiempo de púlsar | 7 | 0.1 |
| Astrometría | 2 | 0.0 |
| Variaciones en el tiempo de púlsar | 2 | 0.0 |
| Cinemática de disco | 1 | 0.0 |
No obstante, al considerar la distribución del número de planetas extrasolares encontrados según año y método de descubrimiento (Figura 2) se observa claramente que entre los años 1995 y 2009 la mayor parte de dichos cuerpos era detectado a través del método de velocidad radial (100% de los descubrimientos entre 1995 y 1999, 89.6% de los hallazgos en el periodo 2000-2004 y 71.2% de los exoplanetas encontrados entre 2005 y 2009), mientras que a partir de 2010 comenzó a cobrar mayor protagonismo la técnica de tránsito, responsable de más del 80.0% de los hallazgos en los periodos 2010-2014 y 2015-2019. Es preciso señalar que otro método que se volvió relevante a partir del 2010 fue el método de microlentes gravitacionales, aunque en mucha menor medida que los mencionados anteriormente (1.5% de los descubrimientos entre 2010 y 2014, 2.5% de los hallazgos en el periodo 2015-2019 y 5.9% de los exoplanetas encontrados a partir de 2020).
3.2 Características de los exoplanetas encontrados
3.2.1 Periodos y tamaños orbitales, radios y masas planetarias
A continuación, se comentarán brevemente las características de los planetas extrasolares confirmados en relación a sus periodos orbitales, radios planetarios, masas planetarias y tamaños orbitales (en la Tabla 2 se presentan algunas medidas descriptivas para las variables mencionadas).
Periodo orbital (tiempo que le toma al exoplaneta dar una vuelta completa en torno a la estrella central del sistema). En cuanto al periodo orbital (Figura 3, con escala logarítmica en el eje de abscisas para facilitar la visualización), se observa una distribución de tipo bimodal y marcadamente asimétrica hacia la derecha, con un máximo principal en torno a los 10 días terrestres y uno secundario alrededor de los 1000. Los cuerpos hallados poseen periodos que van desde los 0.09 días terrestres (un poco más de 2 horas) a unos impactantes 402000000 días (más de un millón de años terrestres). El 75% de los exoplanetas de existencia confirmada para los que se cuenta con esta información posee un periodo orbital menor o igual a los 41.4 días terrestres y sólo el 0.1% supera los 100000 (aproximadamente 273 años terrestres). En la misma figura, se representa la duración del año terrestre para ser tomado como referencia. Del Archivo consultado, hay 193 planetas para los que no se cuenta con información acerca de esta variable.
Radio planetario. La distribución de la variable radio planetario (Figura 4) también es bimodal y marcadamente asimétrica hacia la derecha, con un máximo principal en torno a los 2.5 radios terrestres y uno secundario en torno a los 13. Los cuerpos hallados poseen tamaños que van desde los 0.3 radios terrestres a los 77.3, y el 50% de los exoplanetas cuya existencia ha sido confirmada presenta un radio menor o igual a 2.74 veces el radio de la Tierra, lo que deja en claro que la gran mayoría de los cuerpos encontrados posee un tamaño mayor al de nuestro planeta. Por su parte, el gráfico de la derecha, de violín y boxplot, pone en evidencia que existen sólo 4 planetas extrasolares confirmados con tamaños superiores a 30 radios terrestres. Del Archivo consultado, hay 17 planetas para los que no se cuenta con información acerca de esta variable.
En función del radio, los exoplanetas suelen clasificarse según su semejanza de tamaño con los de algunos planetas del Sistema Solar (Figura 5). La mayor parte de ellos son de tipo neptuniano (37.8%, con radios entre 2 y 6 veces el de la Tierra), seguido por un 22.1% de planetas jovianos (radios entre 6 y 13.7 veces el radio terrestre) y un 20.5% de planetas superterrestres (con radios mayores al de la Tierra pero menores al de Neptuno). En menor medida, se han encontrado planetas que pueden clasificarse como superjovianos (9.4%, con radios mayores al de Júpiter) y sólo el 9.3% de los planetas confirmados presenta un radio similar al de la Tierra. Finalmente, sólo un 0.6% de los exoplanetas puede clasificarse como subterrestres, ya que presentan un tamaño menor al de la Tierra (más similar al de Marte o incluso al de Mercurio).
Masa planetaria. Al igual que las variables anteriormente mencionadas, la distribución de la masa de los planetas extrasolares encontrados (Figura 6, con escala logarítmica en el eje de abscisas para facilitar la visualización) también es bimodal y con una asimetría marcada hacia la derecha. Se observa un máximo principal centrado en torno a las 8 masas terrestres y uno secundario en torno a las 600 masas terrestres. Cabe destacar que 5039 exoplanetas presentan una masa superior a la de la Tierra, lo que representa un 96.4% de los cuerpos cuya existencia ha sido confirmada hasta la fecha. Existen 23 planetas para los que no se cuenta con información sobre esta variable.
| Variable | Mediana | RI | Mínimo | Máximo |
|---|---|---|---|---|
| Periodo orbital (días) | 11.9 | 38.5 | 0.18 | 402000000.0 |
| Radio orbital (UA) | 0.1 | 0.2 | 0.01 | 7506.0 |
| Radio planetario (radios terrestres) | 2.7 | 9.2 | 0.30 | 30.5 |
| Masa planetaria (masas terrestres) | 8.2 | 126.1 | 0.02 | 45700.0 |
Semi-eje mayor de la órbita (tamaño orbital). Los exoplanetas confirmados poseen radios orbitales que van desde las 0.004 hasta las 7506 unidades astronómicas (una unidad astronómica equivale a la distancia Tierra-Sol), aunque la gran mayoría de los planetas para los que se cuenta con esta información (85.3%) se encuentra más cerca de la estrella central del sistema que lo que la Tierra se encuentra del Sol. Del Archivo consultado, existen 289 planetas confirmados para los que no se cuenta con información acerca de esta variable.
Semi-eje mayor de la órbita vs. periodo orbital. En el diagrama de dispersión de la Figura 7 (construido realizando una transformación logarítmica de ambas variables) se representa el semi-eje mayor de la órbita en función del periodo orbital de los exoplanetas de existencia confirmada. Se observa claramente que existe un alto grado de asociación lineal entre el logaritmo del tiempo que le toma al planeta completar una órbita en torno a la estrella y el de la distancia que existe entre ambos cuerpos. El comportamiento observado es una prueba de la universalidad de la Tercera Ley del Movimiento Planetario de Kepler, según la cual la relación entre el cubo del semi-eje mayor de la órbita de un planeta y el cuadrado de su periodo orbital es aproximadamente constante:
\[\frac{(Semieje)^3}{(Periodo orbital)^2} = constante\]
Masa planetaria vs. periodo orbital. En la Figura 8 se representa, para cada exoplaneta, la masa planetaria en función de su periodo orbital. Los diferentes colores en el gráfico representan los distintos métodos de detección empleados, y este detalle pone en evidencia algunas diferencias importantes en las características de los cuerpos que los distintos métodos detectan preferentemente. El gráfico muestra claramente que a través del método de tránsito tienden a encontrarse aquellos planetas con periodos orbitales pequeños, es decir, los que se encuentran relativamente cerca de la estrella del sistema. Por su parte, los exoplanetas que se detectan en forma directa se caracterizan por poseer periodos orbitales muy grandes y ser masivos. Finalmente, con respecto al método de velocidad radial, si bien ha permitido detectar exoplanetas dentro de un rango amplio de masas y periodos orbitales, la mayor concentración de puntos que se observa en la región de masas y periodos relativamente grandes sugiere que éste conduce preferentemente a la detección de planetas con estas características.
3.2.2 Número de estrellas y planetas por sistema planetario
Número de estrellas y de planetas en el sistema. En las Figuras 9 y 10 se representa gráficamente la distribución de las variables número de estrellas y número de planetas en los sistemas de los que forman parte los planetas extrasolares. El número de estrellas en la totalidad de los sistemas estudiados se encuentra entre 1 y 4, aunque la enorme mayoría de los exoplanetas descubiertos forma parte de sistemas que poseen una única estrella central (91%). En relación al número de planetas que los componen, los sistemas estudiados se encuentran compuestos por entre 1 y 8 exoplanetas. Un 90.9% de los sistemas de los que forman parte los planetas de existencia confirmada se encuentran formados por entre 1 y 3 exoplanetas.
| Variable | Mediana | Media | Rango intercuartil | Desvío estándar |
|---|---|---|---|---|
| Número de estrellas | 1 | 1.10 | 0 | 0.34 |
| Número de planetas | 1 | 1.77 | 1 | 1.16 |
Cabe destacar que, hasta la fecha, no se ha encontrado ninguna luna que orbite alguno de los planetas extrasolares de existencia confirmada.
3.2.3 Distancia de los sistemas extrasolares a la Tierra
La distancia que separa a los sistemas confirmados de nuestro planeta (Figura 11) sigue una distribución asimétrica hacia la derecha, con valores que van desde los 4.2 a los 27723 años luz (Figura 11), con el 50% de los mismos ubicado a una distancia menor o igual a 1371 años luz. Del Archivo consultado, existen 17 planetas para los que no se cuenta con esta información.
3.3 Lugar de descubrimiento
Los exoplanetas confirmados hasta la fecha fueron hallados principalmente a través de telescopios espaciales (68.5%) y en menor medida desde observatorios terrestres (31.3%), en ambos casos desde locaciones únicas (único telescopio y único observatorio, respectivamente). Un mínimo porcentaje de todos los descubrimientos se realizó desde instalaciones o sitios múltiples (sólo un 0.3% del total de exoplanetas confirmados).
En la Figura 13 se representa la distribución del número de exoplanetas descubiertos por año y sitio de descubrimiento. Dicho gráfico permite observar en forma clara que, si bien los primeros hallazgos utilizando un telescopio espacial datan del año 2003, hasta el 2009 prácticamente la totalidad de los descubrimientos se realizaba desde un observatorio terrestre (más del 90% de los hallazgos anuales). A partir de ese año, los telescopios espaciales comenzaron a cobrar especial relevancia, destacándose particularmente los años 2016 y 2014, en los que más del 90% de los descubrimientos se hicieron desde el espacio.
3.3.1 Telescopios espaciales
Si se analizan únicamente los hallazgos realizados desde telescopios espaciales (Figura 14), se ve que los responsables de los saltos cuantitativos observados en 2014 y 2016 fueron el Telescopio Espacial Kepler y su continuación en forma de la Misión K2, los cuales tuvieron un desempeño preponderante durante la mayor parte de la década de 2010. En conjunto, son responsables del 90.4% del total de los descubrimientos realizados directamente desde el espacio (Tabla 4). Aunque con una contribución mucho más modesta, desde el 2019 comenzó a cobrar relevancia la actuación del Telescopio Espacial TESS, una misión lanzada en el año 2018 que hasta la fecha ha permitido encontrar un total de 286 exoplanetas, lo que representa un 8.1% de los hallazgos realizados desde el espacio.
| Telescopio/misión | Número de exoplanetas | Porcentaje (%) |
|---|---|---|
| Telescopio Espacial Kepler | 2708 | 75.3 |
| Misión K2 | 543 | 15.1 |
| Telescopio Espacial TESS | 291 | 8.1 |
| Misión CoRoT | 35 | 1.0 |
| Otros satélites/telescopios espaciales | 12 | 0.3 |
| Telescopio Espacial Hubble | 6 | 0.2 |
3.3.2 Observatorios terrestres
En el siguiente mapa dinámico se encuentra representada la ubicación geográfica de cada uno de los observatorios e instalaciones terrestres desde los cuales se produjeron los hallazgos de los exoplanetas de existencia confirmada. Al pasar el cursor por encima de cada ubicación, puede leerse el nombre de la instalación junto con el número de exoplanetas que se descubrieron desde allí.
Es importante remarcar que para la construcción del mapa se omitieron aquellos descubrimientos que no fueron realizados desde un sitio terrestre en concreto (es decir, aquellos que se hicieron desde instalaciones ubicadas en varios países o múltiples observatorios).
De aquellos descubrimientos que fueron llevados a cabo desde un único sitio terrestre en concreto, la mayor parte se realizó desde instalaciones ubicadas en Chile (41.8%), seguido por Estados Unidos (28.6%). El resto de los países presentan frecuencias menores o iguales al 6.2% (Tabla 5), entre los que pueden mencionarse Francia, Sudáfrica y España. Como curiosidad, cabe señalar que desde las instalaciones del Complejo Astronómico El Leoncito, ubicado en la provincia de San Juan, se descubrió un único exoplaneta: el cuerpo bautizado como RR Cae b, en el año 2012.
| País | Número de exoplanetas | Porcentaje (%) |
|---|---|---|
| Chile | 434 | 41.8 |
| Estados Unidos | 297 | 28.6 |
| Francia | 64 | 6.2 |
| Sudáfrica | 47 | 4.5 |
| España | 46 | 4.4 |
| Australia | 39 | 3.8 |
| Japón | 35 | 3.4 |
| Nueva Zelanda | 28 | 2.7 |
| República de Korea | 22 | 2.1 |
| Qatar | 10 | 1.0 |
| Alemania | 8 | 0.8 |
| China | 5 | 0.5 |
| Puerto Rico | 3 | 0.3 |
| Argentina | 1 | 0.1 |
4 Conclusiones
A modo de cierre, el análisis realizado en el presente reporte sobre las variables seleccionadas del Archivo de Exoplanetas de la NASA ha permitido poner en práctica muchas de las herramientas vistas a lo largo del curso.
Por las características de las bases utilizadas, el único trabajo de limpieza y ordenado que fue necesario realizar tuvo que ver fundamentalmente con la categorización de variables cuantitativas para una interpretación más accesible y la recategorización de algunas variables cualitativas por traducción al español de nombres en inglés o combinación de categorías. Sí fue preciso realizar un trabajo cuidadoso sobre la base datos_geo.xlsx para convertir los datos de ubicaciones geográficas de observatorios terrestres (latitud y longitud) a un formato que permitiera luego su representación gráfica en un mapa.
La diversidad de variables presentes en los datasets (cualitativas y cuantitativas discretas y continuas, incluyendo coordenadas geográficas) posibilitó la inclusión en el documento de una variedad de herramientas gráficas de visualización, entre las que se cuentan gráficos de barras, histogramas, gráficos de violín, boxplots, gráficos de bastones, diagramas de dispersión y herramientas de georreferencia, las cuales resultaron fundamentales para resumir y compartir la información seleccionada del Archivo de Exoplanetas de una forma clara y concisa.